import%20marimo%0A%0A__generated_with%20%3D%20%220.17.6%22%0Aapp%20%3D%20marimo.App(width%3D%22medium%22%2C%20auto_download%3D%5B%22html%22%2C%20%22ipynb%22%5D)%0A%0A%0A%40app.cell%0Adef%20_()%3A%0A%20%20%20%20import%20requests%0A%20%20%20%20import%20numpy%20as%20np%0A%20%20%20%20import%20marimo%20as%20mo%0A%20%20%20%20import%20pandas%20as%20pd%0A%20%20%20%20from%20scipy.io%20import%20arff%0A%20%20%20%20from%20IPython.display%20import%20display%0A%20%20%20%20from%20sklearn.datasets%20import%20load_iris%0A%20%20%20%20return%20arff%2C%20load_iris%2C%20np%2C%20pd%2C%20requests%0A%0A%0A%40app.cell%0Adef%20_(requests)%3A%0A%20%20%20%20from%20io%20import%20StringIO%0A%0A%0A%20%20%20%20def%20load_url(link%3A%20str%2C%20get_raw_string%3A%20bool%20%3D%20False)%20-%3E%20%22StringIO%22%3A%0A%20%20%20%20%20%20%20%20r%20%3D%20requests.get(link%2C%20allow_redirects%3DTrue)%0A%20%20%20%20%20%20%20%20r.raise_for_status()%0A%20%20%20%20%20%20%20%20return%20r.text%20if%20get_raw_string%20else%20StringIO(r.text)%0A%20%20%20%20return%20(load_url%2C)%0A%0A%0A%40app.cell%0Adef%20_(load_iris)%3A%0A%20%20%20%20data%20%3D%20load_iris()%0A%20%20%20%20return%20(data%2C)%0A%0A%0A%40app.cell%0Adef%20_(data%2C%20pd)%3A%0A%20%20%20%20df%20%3D%20pd.DataFrame(data.data)%0A%20%20%20%20return%20(df%2C)%0A%0A%0A%40app.cell%0Adef%20_(data)%3A%0A%20%20%20%20data%0A%20%20%20%20return%0A%0A%0A%40app.cell%0Adef%20_(data)%3A%0A%20%20%20%20data.feature_names%0A%20%20%20%20return%0A%0A%0A%40app.cell%0Adef%20_(data)%3A%0A%20%20%20%20data.data.shape%0A%20%20%20%20return%0A%0A%0A%40app.cell%0Adef%20_(df)%3A%0A%20%20%20%20df.describe()%0A%20%20%20%20return%0A%0A%0A%40app.cell%0Adef%20_(df)%3A%0A%20%20%20%20df%5B%3A4%5D%0A%20%20%20%20return%0A%0A%0A%40app.cell%0Adef%20_(arff%2C%20load_url)%3A%0A%20%20%20%20d%2C%20m%20%3D%20arff.loadarff(%0A%20%20%20%20%20%20%20%20load_url(%0A%20%20%20%20%20%20%20%20%20%20%20%20%22https%3A%2F%2Fwww.openml.org%2Fdata%2Fdownload%2F31%2Fdataset_31_credit-g.arff%22%0A%20%20%20%20%20%20%20%20)%0A%20%20%20%20)%0A%20%20%20%20return%20(d%2C)%0A%0A%0A%40app.cell%0Adef%20_(d%2C%20pd)%3A%0A%20%20%20%20pd.DataFrame(d)%0A%20%20%20%20return%0A%0A%0A%40app.cell%0Adef%20_()%3A%0A%20%20%20%20data2%20%3D%20%5B%0A%20%20%20%20%20%20%20%20%7B%22%23courses_opted%22%3A%204%2C%20%22GPA%22%3A%206.7%7D%2C%0A%20%20%20%20%20%20%20%20%7B%22%23courses_opted%22%3A%204%2C%20%22GPA%22%3A%208.5%7D%2C%0A%20%20%20%20%20%20%20%20%7B%22%23courses_opted%22%3A%202%2C%20%22GPA%22%3A%208.1%7D%2C%0A%20%20%20%20%20%20%20%20%7B%22%23courses_opted%22%3A%201%2C%20%22GPA%22%3A%207.2%7D%2C%0A%20%20%20%20%20%20%20%20%7B%22%23courses_opted%22%3A%201%2C%20%22GPA%22%3A%209.1%7D%2C%0A%20%20%20%20%5D%0A%20%20%20%20return%20(data2%2C)%0A%0A%0A%40app.cell%0Adef%20_(data2)%3A%0A%20%20%20%20from%20sklearn.feature_extraction%20import%20DictVectorizer%0A%0A%20%20%20%20dv%20%3D%20DictVectorizer(sparse%3DFalse)%0A%20%20%20%20data_transformed%20%3D%20dv.fit_transform(data2)%0A%20%20%20%20data_transformed%5B%3A2%5D%0A%20%20%20%20return%20(data_transformed%2C)%0A%0A%0A%40app.cell%0Adef%20_(data_transformed)%3A%0A%20%20%20%20data_transformed%0A%20%20%20%20return%0A%0A%0A%40app.cell%0Adef%20_(np)%3A%0A%20%20%20%20from%20sklearn.impute%20import%20SimpleImputer%0A%0A%20%20%20%20imp%20%3D%20SimpleImputer(missing_values%3Dnp.nan%2C%20strategy%3D%22median%22)%0A%20%20%20%20X%20%3D%20%5B%5B4%2C%201%5D%2C%20%5Bnp.nan%2C%205%5D%2C%20%5B8%2C%200%5D%5D%0A%20%20%20%20x_imputed%20%3D%20imp.fit_transform(X)%0A%20%20%20%20return%20(x_imputed%2C)%0A%0A%0A%40app.cell%0Adef%20_(x_imputed)%3A%0A%20%20%20%20x_imputed%5B1%2C%200%5D%0A%20%20%20%20return%0A%0A%0A%40app.cell%0Adef%20_(df)%3A%0A%20%20%20%20df%0A%20%20%20%20return%0A%0A%0A%40app.cell%0Adef%20_(data)%3A%0A%20%20%20%20data.data.count_values()%0A%20%20%20%20return%0A%0A%0A%40app.cell%0Adef%20_(data)%3A%0A%20%20%20%20data.data%0A%20%20%20%20return%0A%0A%0A%40app.cell%0Adef%20_()%3A%0A%20%20%20%20return%0A%0A%0Aif%20__name__%20%3D%3D%20%22__main__%22%3A%0A%20%20%20%20app.run()%0A
7cd8906f5a7813b8ada55e83d102dd4dae17db6b1232abe458dc60ca14bd77e0